检索结果

Select

1. AdaBoost的样本权重与组合系数的分析及改进

朱亮, 徐华, 成金海, 朱深

《计算机应用》唯一官方网站 2022, 42 (7): 2022-2029. DOI: 10.11772/j.issn.1001-9081.2021050726

摘要（376）

HTML （18）

PDF （1311KB）（56）

针对自适应增强（AdaBoost）算法的基分类器线性组合效率低以及过度关注难分样本的问题，提出了基于间隔理论的两种改进算法WPIAda与WPIAda.M。首先，WPIAda与WPIAda.M算法都将样本权值的更新分为四种情形，从而增加间隔从正到负变化的样本权值来抑制间隔的负向移动，并减少间隔处于零点的样本数量；其次，WPIAda.M算法根据基分类器的错误率与样本权重的分布状态，给出新的基分类器系数求解方法，从而提高基分类器的组合效率。在10个UCI数据集上，与dfAda、skAda、swaAda等算法相比，WPIAda和WPIAda.M算法的测试误差分别平均降低了7.46个百分点和7.64个百分点；AUC分别提高了11.65个百分点和11.92个百分点。实验结果表明，WPIAda和WPIAda.M算法可以有效降低对难分样本的关注，并且WPIAda.M算法能够更高效地集成基分类器，因此两种算法均可进一步提高分类性能。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于基分类器系数和多样性的改进AdaBoost算法

朱亮, 徐华, 崔鑫

计算机应用 2021, 41 (8): 2225-2231. DOI: 10.11772/j.issn.1001-9081.2020101584

摘要（411）

PDF （1058KB）（465）

针对传统AdaBoost算法的基分类器线性组合效率低以及过适应的问题，提出了一种基于基分类器系数与多样性的改进算法——WD AdaBoost。首先，根据基分类器的错误率与样本权重的分布状态，给出新的基分类器系数求解方法，以提高基分类器的组合效率；其次，在基分类器的选择策略上，WD AdaBoost算法引入双误度量以增加基分类器间的多样性。在五个来自不同实际应用领域的数据集上，与传统AdaBoost算法相比，CeffAda算法使用新的基分类器系数求解方法使测试误差平均降低了1.2个百分点；同时，WD AdaBoost算法与WLDF_Ada、AD_Ada、sk_AdaBoost等算法相对比，具有更低的错误率。实验结果表明，WD AdaBoost算法能够更高效地集成基分类器，抵抗过拟合，并可以提高分类性能。

参考文献 | 相关文章 | 多维度评价

Select

3. 面向不均衡数据集的过抽样算法

崔鑫, 徐华, 宿晨

计算机应用 2020, 40 (6): 1662-1667. DOI: 10.11772/j.issn.1001-9081.2019101817

摘要（342）

PDF （749KB）（375）

合成少数类过抽样技术（SMOTE）中的噪声样本可能参与合成新样本，所以难以保证新样本的合理性。针对这个问题，结合聚类算法提出了改进算法CSMOTE。该算法抛弃了SMOTE在最近邻间线性插值的思想，使用少数类的簇心与其对应簇中的样本进行线性插值合成新样本，并且对参与合成的样本进行了筛选，降低了噪声样本参与合成的可能。在六个实际数据集上，将CSMOTE算法与四个SMOTE的改进算法以及两种欠抽样算法进行了多次的对比实验，CSMOTE算法在所有数据集上均获得了最高的AUC值。实验结果表明，CSMOTE算法具有更高的分类性能，可以有效解决数据集中样本分布不均衡的问题。

参考文献 | 相关文章 | 多维度评价

Select

4. 基于听皮层神经元感受野的强噪声环境下说话人识别

牛晓可, 黄伊鑫, 徐华兴, 蒋震阳

计算机应用 2020, 40 (10): 3034-3040. DOI: 10.11772/j.issn.1001-9081.2020020272

摘要（391）

PDF （1737KB）（543）

针对说话人识别易受环境噪声影响的问题，借鉴生物听皮层神经元频谱-时间感受野（STRF）的时空滤波机制，提出一种新的声纹特征提取方法。在该方法中，对基于STRF获得的听觉尺度-速率图进行了二次特征提取，并与传统梅尔倒谱系数（MFCC）进行组合，获得了对环境噪声具有强容忍的声纹特征。采用支持向量机（SVM）作为分类器，对不同信噪比（SNR）语音数据进行测试的结果表明，基于STRF的特征对噪声的鲁棒性普遍高于MFCC系数，但识别正确率较低；组合特征提升了语音识别的正确率，同时对环境噪声具有良好的鲁棒性。该结果说明所提方法在强噪声环境下说话人识别上是有效的。

参考文献 | 相关文章 | 多维度评价

Select

5. AdaBoost的多样性分析及改进

王玲娣, 徐华

计算机应用 2018, 38 (3): 650-654. DOI: 10.11772/j.issn.1001-9081.2017092226

摘要（614）

PDF （925KB）（531）

针对AdaBoost算法下弱分类器间的多样性如何度量问题以及AdaBoost的过适应问题，在分析并研究了4种多样性度量与AdaBoost算法的分类精度关系的基础上，提出一种基于双误度量改进的AdaBoost方法。首先，选择Q统计、相关系数、不一致度量、双误度量在UCI数据集上进行实验。然后，利用皮尔逊相关系数定量计算多样性与测试误差的相关性，发现在迭代后期阶段，它们都趋于一个稳定的值；其中双误度量在不同数据集上的变化模式固定，它在前期阶段不断增加，在迭代后期基本上不变，趋于稳定。最后，利用双误度量改进AdaBoost的弱分类器的选择策略。实验结果表明，与其他常用集成方法相比，改进后的AdaBoost算法的测试误差平均降低1.5个百分点，最高可降低4.8个百分点。因此，该算法可以进一步提高分类性能。

参考文献 | 相关文章 | 多维度评价

Select

6. 基于改进人工蜂群的核模糊聚类算法

梁冰, 徐华

计算机应用 2017, 37 (9): 2600-2604. DOI: 10.11772/j.issn.1001-9081.2017.09.2600

摘要（604）

PDF （801KB）（553）

针对核模糊C均值（KFCM）算法对初始聚类中心敏感、易陷入局部最优的问题，利用人工蜂群（ABC）算法的构架简单、全局收敛速度快的优势，提出了一种改进的人工蜂群算法（IABC）与KFCM迭代相结合的聚类算法。首先，以IABC求得最优解作为KFCM算法的初始聚类中心，IABC在迭代过程中将与当前维度最优解的差值的变化率作为权值，对雇佣蜂的搜索行为进行改进，平衡人工蜂群算法的全局搜索与局部开采能力；其次，以类内距离和类间距离为基础，构造出适应KFCM算法的适应度函数，利用KFCM算法优化聚类中心；最后，IABC和KFCM算法交替执行，实现最佳聚类效果。采用3组Benchmark测试函数6组UCI标准数据集进行仿真实验，实验结果表明，与基于改进人工蜂群的广义模糊聚类（IABC-KGFCM）相比，IABC-KFCM对数据集的聚类有效性指标提高1到4个百分点，具有鲁棒性强和聚类精度高的优势。

参考文献 | 相关文章 | 多维度评价

Select

7. 改进离散粒子群算法求解柔性流水车间调度问题

徐华, 张庭

计算机应用 2015, 35 (5): 1342-1347. DOI: 10.11772/j.issn.1001-9081.2015.05.1342

摘要（520）

PDF （963KB）（594）

针对以最小化完工时间为目标的柔性流水车间调度问题(FFSP),提出了一种改进离散粒子群(DPSO)算法.所提算法重新定义粒子速度和位置的相关算子,并引入编码矩阵和解码矩阵来表示工件、机器以及调度之间的关系.为了提高柔性流水车间调度问题求解的改进离散粒子群算法的初始群体质量,通过分析初始机器选择与调度总完工时间的关系,首次提出一种基于NEH算法的最短用时分解策略算法.仿真实验结果表明,该算法在求解柔性流水车间调度问题上有很好的性能,是一种有效的调度算法.

参考文献 | 相关文章 | 多维度评价

Select

8. 基于多尺度粗糙集模型的决策树优化算法

陈家俊苏守宝徐华丽

计算机应用 2011, 31 (12): 3243-3246.

摘要（1243）

PDF （587KB）（728）

针对经典决策树算法构造的决策树结构复杂、缺乏对噪声数据适应能力等局限性，基于多尺度粗糙集模型提出一种新的决策树构造算法。算法引入尺度变量和尺度函数概念，采用不同尺度下近似分类精度选择测试属性构造决策树，使用抑制因子对决策树进行修剪，有效地去除了噪声规则。结果表明该算法构造的决策树简单有效，对噪声数据有一定的抗干扰性，且能满足不同用户对决策精度的要求。